با اصطلاح فاصله اطمینان و کاربرد آن آشنا شوید. |
در بررسي فرضيه هاي مطرح شده در يک مطالعه از شاخصي تحت عنوان p value استفاده مي شود. اين شاخص داراي محدوديتهايي است. در مثال زير از اين محدوديتها آگاه مي شويم:
براي حل کردن مشکلاتي نظير مشکل مطالعه مطرح شده از روشي استفاده مي شود که در آن سؤال نمي شود که آيا p value به دست آمده اختلاف آماري معني داري دارد يا نه بلکه اين روش در پاسخ به دو سؤال زير مطرح مي شود: شاخصي که به نحو بهتري قادر خواهد بود تفاوت ميان دو گروه را نشان دهد چيست؟ محدوده واقعي تفاوت ميان دو گروه چگونه است؟ براي يافتن پاسخ اين سؤالات از شاخص فاصله اطمينان استفاده مي شود.
فرض کنيد سکه اي داريم که مطمئن نيستيم احتمال اينکه در هر بار پرتاب آن شير يا خط بيايد با هم برابر است (0.5) و يا اين سکه بالانس نبوده و اين احتمال به نفع يک سر سکه بيشتر يا کمتر است. در اين شرايط ما سعي مي کنيم به امتحان سکه بپردازيم:
سکه را دو بار پرتاب مي کنيم. در يک پرتاب شير و در پرتاب ديگر خط داريم. در اين حالت تخميني که براي احتمال شير يا خط آمدن در نظر گرفته مي شود چگونه است؟ آيا با اين يک بار انداختن سکه ميتوان نتيجه گرفت که احتمال به دست آوردن شير يا خط در هربار پرتاب با هم برابر و 0.5 ميباشد؟ اگر احتمال شير يا خط آمدن در هر پرتاب برابر با0.1 و يا 0.9 باشد باز هم چندان تعجب آور نخواهد بود اگر در يک پرتاب دوتايي يک شير و يک خط داشته باشيم. در واقع پس از يک پرتاب دوتايي سکه هم جنان مطمئن نخواهيم بود که اين سکه به درستي کار ميکند يا نه.
در آزمون ديگري ما روند انداختن سکه را 8 بار ديگر تکرار ميکنيم. در اين آزمون 10 نتيجه مختلف خواهيم داشت که 5 تاي آنها شير و 5 تا خط بوده است. در اين حالت بهتريت تخميني که ميتوانيم از احتمال به دست آمدن شير يا خط در هر پرتاب بزنيم برابر با 0.5 براي هرکدام خواهد بود. هم جنين محدوده اي که اين نتيجه در آن قرار دارد بسيار باريکتر شده و گستردگي زيادي ندارد. در واقع در اين حالت بسيار غير محتمل به نظر مي رسد که احتمال يکي از موارد شير يا خط 0.9 باشد. چرا که در صورتي که اينگونه بود بسيار غير محتمل مي نمود که در يک نمونه 10 تايي تنها 5 شير يا خط (نمونه با احتمال زياد) داشته باشيم. در اين شرايط بهترين شاخصي که مي توان براي توضيح احتمال شير يا خط در هر بار پرتاب به دست بيايد عدد 0.5 است. اگرچه در پايان اين آزمون اعدادي که فاصله زيادي با عدد 0.5 دارند نظير 0.1 يا 0.9 بسيار غير محتمل به نظر مي رسند ولي هم چنان اعداد نزديک به 0.5 نظير 0.4 يا 0.6 بسيار محتملند. اين در حالي است که هر چه اين عدد از 0.5 فاصله مي گيرد احتمال اينکه واقعيت داشته باشد کمتر مي شود. در صورتي که اين آزمون را با پرتابهاي بيشتري تکرار کنيم بيشتر و بيشتر به واقعيت نزديک خواهيم شد.
در حقيقت روشي که ما در اين آزمونها به کار ميبريم استفاده از روشي است که در آن بتوان حدود اطمينان را در اطراف يک يافته مشخص (0.5) به دست آوريم. در هر آزمون اين فاصله اطمينان (Confidence Interval) حدودي است که به احتمال زياد واقعيت در آن وجود دارد. هر چقدر تعداد نمونه هايي که به دست ميآوريم کمتر باشد اين بازه وسيعتر بوده و به همان ميزان نيز احتمال رسيدن به واقعيت کمتر است. در واقع وقتي حجم نمونه به ميزان زيادي بالا مي رود ما با اطمينان بيشتري قادر خواهيم بود بيان کنيم که عددي که به دست آورده ايم به واقعيت نزديک است و CI نيز بازه محدودتري دارد.
از سوي ديگر به منظور دست يافتن به فاصله اطمينان در مرحله اول بايد مشخص کنيم که منظور ما به عنوان محقق از فاصله اطمينان چيست. يعني در واقع چه حدي از فاصله اطمينان براي ما قابل قبول است. براي اين منظور فاصلهCI در نظر گرفته شده در اکثر مطالعات برابر با 99? ويا 95% ويا 90% مي باشد که به اين معني است که در صورتي که مطالعه مورد نظر 100 بار تکرار شود در 99 يا 95 يا 90 بار آن همين محدوده به دست خواهد آمد. هر چه عدد مربوط به CI از 100 فاصله مي گيرد ميزان دقت آن کاهش مي يابد. به اين معني که احتمال اينکه شاخصي که با 99% CI بيان شده به واقعيت نزديک باشد بيشتر از شاخصي است که با 95% CI بيان مي شود.
در برخورد با مثال مربوط به نارسايي قلبي نيز تفسير بايد با استفاده از حدود اطمينان صورت گيرد. هر يافته اي که حدود اطمينان باريکتري (narrow) داشته باشد و عدد مربوط به CI آن بزرگتر باشد به واقعيت نزديکتر است و مي توان بر اساس آن تصميم گرفت.